June 27, 2022

Dataset

Dati sulla biodiversità

I dati sulla biodiversità mondiale sono stati ottenuti dalla rete GBIF attraverso il download dall’apposito portale [4].

Il Global Biodiversity Information Facility è una rete internazionale e un’infrastruttura dati fondata dai governi mondiali che si pone l’obbiettivo di fornire libero accesso ai dati riguardanti tutti i tipi di vita sulla Terra [5].

Lettura del file

Il file contenete il dataset è un file .csv dove il separatore è il carattere speciale di tabulazione \t.

La lettura del file è stata operata utilizzando l’apposita funzione read_csv(), specificando gli oportuni parametri.

Struttura del dataset

Il dataset è composto dalle seguenti colonne:

  • taxonKey: chiave primaria del DB di provenienza del dato;

  • scientificName: nome scentifico del dato;

  • acceptedTaxonKey: chiave primaria del DB GBIF;

  • acceptedScientificName: nome scentifico all’interno del DB GBIF;

  • numberOfOccurrences: occorrenze del dato;

  • taxonRank: tipologia di dato tassonomico;

  • taxonomicStatus: indica se il dato è stato accettato o meno oppure se si tratta di un sinonimo;

  • taxa tassonomici: colonne che indicano regno, phylum, classe, ordine, genus e specie. Ogni colonna ha associata una colonna che contiene la chiave esterna verso l’attributo acceptedTaxonKey della relativa entry nella base di dati;

  • iucnRedListCategory: nel caso delle singole specie contiene il rischio di estinzione.

Esempio

taxonKey scientificName acceptedTaxonKey acceptedScientificName numberOfOccurrences taxonRank taxonomicStatus kingdom kingdomKey phylum phylumKey class classKey order orderKey family familyKey genus genusKey species speciesKey iucnRedListCategory
341 Turbellaria 341 Turbellaria 10022 CLASS ACCEPTED Animalia 1 Platyhelminthes 108 Turbellaria 341 NA NA NA NA
830 Nitrospirales 830 Nitrospirales 4750 ORDER ACCEPTED Bacteria 3 Nitrospirota 10860391 Nitrospiria 10889728 Nitrospirales 830 NA NA NA
879 Ceratodontiformes 879 Ceratodontiformes 3 ORDER ACCEPTED Animalia 1 Chordata 44 Sarcopterygii 238 Ceratodontiformes 879 NA NA NA
982 Neogastropoda 982 Neogastropoda 1574 ORDER ACCEPTED Animalia 1 Mollusca 52 Gastropoda 225 Neogastropoda 982 NA NA NA
1445 Psittaciformes 1445 Psittaciformes 1166 ORDER ACCEPTED Animalia 1 Chordata 44 Aves 212 Psittaciformes 1445 NA NA NA
2390 Scrophulariaceae 2390 Scrophulariaceae 13058 FAMILY ACCEPTED Plantae 6 Tracheophyta 7707728 Magnoliopsida 220 Lamiales 408 Scrophulariaceae 2390 NA NA NE
2571 Linhomoeidae 2571 Linhomoeidae 38 FAMILY ACCEPTED Animalia 1 Nematoda 5967481 Chromadorea 11133537 Monhysterida 445 Linhomoeidae 2571 NA NA
2916 Phaeosaccionaceae 2916 Phaeosaccionaceae 274 FAMILY ACCEPTED Chromista 4 Ochrophyta 98 Phaeophyceae 7073593 Phaeothamniales 482 Phaeosaccionaceae 2916 NA NA
3162 Fellodistomatidae 4861464 Fellodistomidae 9 FAMILY SYNONYM Animalia 1 Platyhelminthes 108 Trematoda 345 Plagiorchiida 434 Fellodistomidae 4861464 NA NA
4334 Apidae 4334 Apidae 29573 FAMILY ACCEPTED Animalia 1 Arthropoda 54 Insecta 216 Hymenoptera 1457 Apidae 4334 NA NA NE

Dati sulle interazioni

I dati sulle interazioni sono stati ottenuti da GloBI scaricando l’apposito file .csv.

GloBI [8] è un’infrasturttura che si pone come obbiettivo la raccolta dei dati da vari dataset pubblicati dagli studiosi per definire tutte le interazioni tra le specie che compongono la biosfera terrestre.

Lettura del file

Il file contenete il dataset, come detto in precedenza, è un file .csv ordinario.

Il peso del file, 25.82GB, ha comportato la necessità di utilizzare un server esterno per l’elaborazione iniziale del dataset: utilizzando la piattaforma AWS è stata predisposta un’istanza EC2 con 16vCPU, 64GB di memoria RAM e un SSD da 60GB. Sull’istanza EC2 è stato installata l’ultima versione di Ubuntu, R, RStudio Server e tutte le dipendenze necessarie.

Aprendo poi la porta 80 e configurando le credenziali d’accesso è stata utilizzata l’interfaccia web di RStudio Server per effettuare la prima lavorazione del dataset.

Dataset derivato

Dal dataset iniziale contenente 13,997,237 osservazioni strutturate in 92 variabili è stato ottenuto un dataset derivato dal peso di 663.56 MB, con 4,244,082 osservazioni costituite da 13 variabili.

Struttura del dataset

Il dataset è composto dalle seguenti colonne:

  • taxa tassonomici della sorgente dell’interazione: colonne che indicano regno, phylum, classe, ordine, genus e specie;

  • taxa tassonomici del destinatario dell’interazione: colonne che indicano regno, phylum, classe, ordine, genus e specie;

  • interactionTypeName: contiene il tipo d’interazione.

Esempio

sourceTaxonGenusName sourceTaxonFamilyName sourceTaxonOrderName sourceTaxonClassName sourceTaxonPhylumName sourceTaxonKingdomName targetTaxonGenusName targetTaxonFamilyName targetTaxonOrderName targetTaxonClassName targetTaxonPhylumName targetTaxonKingdomName interactionTypeName
Molossus Molossidae Chiroptera Mammalia Chordata Animalia Myotis Vespertilionidae Chiroptera Mammalia Chordata Animalia coRoostsWith
Myotis Vespertilionidae Chiroptera Mammalia Chordata Animalia Phyllostomus Phyllostomidae Chiroptera Mammalia Chordata Animalia coRoostsWith
Tadarida Molossidae Chiroptera Mammalia Chordata Animalia Taphozous Emballonuridae Chiroptera Mammalia Chordata Animalia coRoostsWith
Taphozous Emballonuridae Chiroptera Mammalia Chordata Animalia Taphozous Emballonuridae Chiroptera Mammalia Chordata Animalia coRoostsWith
Hipposideros Hipposideridae Chiroptera Mammalia Chordata Animalia Rhinolophus Rhinolophidae Chiroptera Mammalia Chordata Animalia coRoostsWith
Miniopterus Vespertilionidae Chiroptera Mammalia Chordata Animalia Rhinolophus Rhinolophidae Chiroptera Mammalia Chordata Animalia coRoostsWith
Rhinolophus Rhinolophidae Chiroptera Mammalia Chordata Animalia Rhinolophus Rhinolophidae Chiroptera Mammalia Chordata Animalia coRoostsWith
Eptesicus Vespertilionidae Chiroptera Mammalia Chordata Animalia Myotis Vespertilionidae Chiroptera Mammalia Chordata Animalia coRoostsWith
Myotis Vespertilionidae Chiroptera Mammalia Chordata Animalia Myotis Vespertilionidae Chiroptera Mammalia Chordata Animalia coRoostsWith
Myotis Vespertilionidae Chiroptera Mammalia Chordata Animalia Pipistrellus Vespertilionidae Chiroptera Mammalia Chordata Animalia coRoostsWith

Dataset sulle formiche

I dati sulla colonia di formiche sono state ottenute da una ricerca [7].

Lettura dei file

I dati sulla colonia sono divisi su più file di testo, ognuno contenente la matrice di adiacenza relativa alle interazioni di un determinato giorno.

Inoltre, è presente un file .csv contenente i dati relativi ai singoli individui.

Per la lettura dei file di testo si è predisposta un’apposita funzione, mentre per il file .csv è stata utilizzata la funzione di base.

Struttura dei dataset

Sono stati prodotti due dataframe contenenti rispettivamente i dati sui nodi e i dati sugli archi del grafo delle interazioni all’interno della colonia.

Biodiversità

Cos’é la biodiversità?

Diversità biologica [[1]

Variabilità degli organismi viventi di ogni origine, compresi inter alia gli ecosistemi terrestri, marini ed altri ecosistemi acquatici, ed i complessi ecologici di cui fanno parte; ciò include la diversità nell’ambito delle specie, e tra le specie degli ecosistemi.

Perché la biodiversità è importante?

La biodiversità è importante per tutti i processi che supportano la vita sulla Terra. Se osserviamo l’ecosistema che ci circonda possiamo vedere come tutto ciò che avviene in esso è basato sull’interazione tra specie biologiche diverse tra di loro che svolgono funzioni diverse e complementari.

La perdita della diversità biologica costituisce un pericolo per la vita di tutti gli organismi sul nostro pianeta, noi inclusi. Per questo motivio è importante che ognuno di noi sia conoscio di quanto ogni creatura che ci circonda svolga un ruolo fondamentale per la nostra vita [9].

Regni tassonomici

La tassonomia moderna identifica, al livello più alto della classificazione, 8 regni di entità biologiche: Animalia, Archaea, Bacteria, Chromista, Fungi, Plantae, Protozoa e Virus.

Per una questione di sotto-campionamento rispetto alle osservazioni degli scienziati [2,6] vengono esculsi dall’analisi i regni Archaea, Bacteria e Virus.

Attualmente sono classificate 1,505,524 specie diverse divise in 5 regni. Com’è possibile vedere dalla figura Fig. 1, il regno Animalia è il più classificato rispetto agli altri con più del doppio delle specie del regno Plantae.

Piante e animali

Come visto in precedenza piante e animali rappresentano i due regni più classificati in tassonomia. Di seguito vengono presentati due mappe ad albero che rappresentano uno spaccato sui due regni citati in precedenza.

Le mappe ad albero si strutturano a livello macroscopico dal regno e vanno in profondità fino alla famiglia. Poteva essere utilizzata una granularità più fine, fino alla specie, ma la complessità dell’output non avrebbe reso navigabile le mappe per via dell’alto numero di elementi.

Piante

phylum class order family genus
Charophyta Charophyceae Charales Characeae Nitella
Chlorophyta Ulvophyceae Ulotrichales Ulotrichaceae Gloeotila
Chlorophyta Ulvophyceae Dasycladales Dasycladaceae Bornetella
Tracheophyta Polypodiopsida Polypodiales Dryopteridaceae Elaphoglossum
Rhodophyta Florideophyceae Batrachospermales Batrachospermaceae Sirodotia
Rhodophyta Florideophyceae Corallinales Hapalidiaceae Melobesia
Rhodophyta Florideophyceae Gelidiales Gelidiaceae Gelidium
Rhodophyta Florideophyceae Rhodymeniales Rhodymeniaceae Botryocladia
Rhodophyta Florideophyceae Gigartinales Gigartinaceae Mazzaella
Bryophyta Sphagnopsida Sphagnales Sphagnaceae Sphagnum
  • 92% degli organismi vegetali fanno parte del phylum Tracheophyta (dotati di tessuto vascolare e organi);

  • Altri phylum costituiti da organismi vegetali più semplici come alghe e muschi.

Risulta rilevante notare come il numero di specie del phylum Tracheophyta sia largamente maggiore rispetto al numero di specie degli altri phylum nonostante questi ultimi abbiano il vantaggio di essere organismi più semplici. Questo può essere ricondotto al fatto che gli organismi del phylum Tracheophyta:

  • possano svilupparsi non solo in larghezza ma anche in altezza, per via della vascolarizzazione;

  • abbiano un vantaggio riproduttivo dovuto alla presenza di organi riproduttivi che consentono una riproduzione sessuata che migliora la variabilità genetica degli individui.

Animali

phylum class order family genus
Rotifera Eurotatoria Ploima Lecanidae Lecane
Bryozoa Phylactolaemata Plumatellida Cristatellidae Cristatella
Bryozoa Stenolaemata Cryptostomida Intraporidae Intrapora
Bryozoa Stenolaemata Cyclostomatida Tubuliporidae Tubulipora
Bryozoa Stenolaemata Cyclostomatida Annectocymidae Annectocyma
Bryozoa Gymnolaemata Cheilostomatida Flustridae Hincksina
Bryozoa Gymnolaemata Cheilostomatida Smittinidae Parasmittina
Bryozoa Gymnolaemata Cheilostomatida Calloporidae Onychoblestrum
Bryozoa Gymnolaemata Cheilostomatida Candidae Notoplites
Bryozoa Gymnolaemata Cheilostomatida Conescharellinidae Trochosodon

In questo caso è interessante notare come sia maggiore il numero di specie del phylum Arthropoda rispetto al numero di specie del phylum Chordata, infatti, gli organismi del phylum Arhtropoda sono organismi nettmanete più semplici.

Vedendo poi la divisione del phylum Arthropoda, si nota che questo è composto per il 82% da specie della classe Insecta, che si ritiene essere una delle più antiche forme di vita terreste, il che può essere motivo del numero elevato di specie.

Nonostante vi siano un numero elevato di specie registrate, gli insetti sono una delle classi maggiormente minacciate dall’attività umana e ogni anno la biodiversità all’interno di questa classe è in diminuizione.

Biodiversità - interazioni

Interazioni degli organismi

Sfruttando il dataset messo a disposizione da Global Biotic Interactions è possibile avere una visualizzazione di quelle che sono le interazioni tra i regni tassonomici precedentemente presentati.

Nel dataset sono incluse 3,855,516 interazioni tra i regni, divise in 39 tipi.

Dalla figura Fig. 2 si può notare come la maggior parte delle interazioni siano di tipo simbiontico hasHost, tuttavia la relazione inversa symbiontOf ha poche occorrenze (questa relazione è contenuta nella categoria other), questo indica che sono più le specie che “accettano” un individuo simbiontico piuttosto che le specie che hanno la necessità di essere simbionti.

Approfondimento sull’interazione hasHost

Analizzando il grafico in figura Fig. 3 si può osservare come il regno “più ospitante” relazioni simbiontiche sia il Plantae, mentre il regno più ospitato sia il Fungi. L’associazione simbiontica tra Plantae e Fungi si caratterizza in alcune forme note come micorrize [3] (fusione degli apparati radicali) e licheni (associazione fungo-alga).

Schema dello scambio simbiontico nella micorriza

Schema dello scambio simbiontico nella micorriza

Rete dell’interazione eats

Di seguito viene riportato il grafo che rappresenta l’interazione eats tra i vari regni. Nel grafo i nodi hanno grandezza proporzionale alla centralità di grado totale, mentre gli archi hanno spessore proporzionale al numero di occorrenze della relazione direzionata eats tra i due regni collegati dall’arco.

Si può notare come tutti i regni interagiscano sotto questo tipo di relazione e la rete risulta essere debolmente connessa. Questo permette di osservare che ogni specie è legata ad altre specie e la perdiata di una di esse può portare ad un effetto a catena in cui i vari archi iniziano ad indebolirsi (diminuisce il numero di occorrenze).

Interazioni dell’uomo

Seppur incomplete, di segutio vengono presentate le principali interazioni che l’uomo ha con la biodiversità.

Possiamo vedere come il uomo e specie dei vari regni siano legati in modo importante e che l’uomo non può fare a meno di interagire con altre specie, per quanto insignificanti possano sembrare.

La rete sociale nelle formiche

Introduzione

Molto spesso siamo troppo pervasi da un senso di superiorità davanti alla natura per il quale non siamo in grado di capire la fragilità del mondo che ci circonda e di quanto noi siamo dannosi. In questa sezione verrà analizzata la rete sociale all’interno di una colonia di formiche per dimostrare quanto una cosa che noi possiamo pensare piccola, semplice ed irrilevante sia in realtà estremamente complessa.

La colonia

La colonia di formiche in esame è una colonia della specie Camponotus fellah, tipica del Medio Oriente e del Nord Africa.

Alcune formiche operaie

Alcune formiche operaie

Le colonie di formiche sono divise in caste, in questo dataset ne sono state considerate quattro: regina (Q), nutrici (N), “pulitori” (C) e raccoglitori (F).

colony tag_id body_size age.days. nb_foraging_events group_period1 group_period2 group_period3 group_period4 visits_to_brood visits_to_nest_entrance visits_to_rubbishpile nb_interaction_nurses nb_interaction_cleaners nb_interaction_foragers nb_interaction_queen
4 0 153.496 330 0 N N N N 287.636 0.1818180 2.0000000 167.0909 65.27273 12.54546 6.636
4 29 165.421 330 0 N C C C 144.091 0.0909091 4.3636400 201.0909 190.63636 85.36364 2.455
4 50 161.450 246 0 N N NA NA 333.727 0.1818180 1.5454500 251.9091 107.45455 30.63636 16.450
4 52 170.848 57 0 N N N NA 324.545 0.0000000 0.8181820 238.5454 142.09091 32.81818 17.450
4 63 151.400 246 0 N N N F 250.182 0.0000000 0.0909091 165.9091 109.72727 28.54546 5.000
4 127 143.757 85 0 N C C F 208.273 0.0909091 0.8181820 129.8182 95.36364 41.81818 4.364
4 137 140.801 330 0 N C N NA 449.364 0.0909091 4.7272700 176.8182 128.36364 39.36364 9.727
4 139 150.546 330 0 N N N N 447.455 0.0909091 2.4545500 159.3636 75.09091 18.63636 13.910
4 156 173.046 40 0 N N N N 372.182 0.1818180 1.9090900 230.0909 88.63636 26.45454 21.550
4 159 153.264 40 0 N N N NA 159.455 0.0000000 0.1818180 145.3636 85.72727 22.81818 11.180
from to count day
4 260 17 1
4 52 4 1
4 540 7 1
4 6 4 1
4 7 1 1
4 9 2 1
4 14 7 1
4 19 5 1
4 26 5 1
4 30 1 1

In particolare, la colonia è composta da 110 esemplari divisi, nei primi 11 giorni, nelle seguenti caste:

group count
Q 1
N 25
C 31
F 53

La colonia è stata monitorata come all’articolo nei riferimenti [7].

Centralità di grado

Com’è visibile dal seguente grafico che compara la distribuzione dei gradi dei nodi sui primi 11 giorni di osservazione, la rete sociale delle formiche non ha un andamento power-law. Questo è compatibile con la biologia della colonia di formiche: se la distribuzione dei gradi fosse power-law allora ci sarebbero uno o più hub nella rete e l’eventuale rimozione di uno di essi comporterebbe un grave pericolo per la colonia.

Osservando il grado della regina possiamo notare come inizialmente questo sia alto e poi tenda a scendere con il passare dei giorni. Ciò può essere collegato al fatto che più la colonia è giovane e maggiore è la dipendenza dalla regina.

Betweenness centrality

La betweenness centrality da un’indicazione su quelli che potrebbero essere nodi particolarmente importanti negli scambi di informazioni, cibo e malattie all’interno della colonia.

Il boxplot si basa sulla betweenness pesata. Il peso è stato calcolato come , dove le occorrenze sono il numero di interazioni tra due nodi nello stesso giorno.

Possiamo osservare come formiche raccoglitrici abbiano betweenness mediamente più alta rispetto agli altri due gruppi e che anche gli outliers siano nettamente più alti. Questo indica che le formiche raccoglitrici sono centrali all’interno della trasmissione sociale nella colonia.

Dalla serie temporale dei gradi raggruppati per nodo possiamo notare che c’è tendenzialmente un nodo che ha weighted betweenness maggiore degli altri, ed è il nodo 100.

Di seguito viene presentato un video che illustra l’evoluzione della betweenness (grandezza del nodo) con il passare dei giorni.

Caste e cluster

Di seguito vengono presentate le differenze di struttura durante i giorni 1, 3, 5, 9 e 11 di osservazione della colonia. Per ogni giorno vengono presentati due grafi:

  • grafo con disposizione dei nodi derivata dall’algoritmo di Fruchterman - Reingold;

  • grafo con la stessa disposizione del precedente ma con nodi divisi in cluster prodotti con l’algoritmo Infomap.

  • L’algoritmo di Fruchterman - Reingold evidenzia la conformazione suddivisa in caste che ci si potrebbe attendere da una colonia di formiche;

  • La suddivisione in cluster della rete evidenzia un cluster di principalmente formiche “foragers” e un cluster di principalmente formiche “cleaners”, mentre i cluster di formiche “nurses” variano con il tempo, in particolare aumentano con il progredire dei giorni.

Conclusioni

Conclusioni

La biosfera è un entità complessa e fragile, nelle cose più piccole troviamo migliaia di anni di perfezionamento ed evoluzione.

Tutte le specie sono legate le une alle altre e l’uomo deve fare lo sforzo di limitare i propri danni e imparare a capire ed interiorizzare il suo ruolo all’interno della biodiversità.

Una piccola parte del tutto e quindi niente se da solo.

Riferimenti

1. 1993. Convention on biological diversity.

2. 2011. Microbiology by numbers. Nature Reviews Microbiology 9, 9: 628–628. https://doi.org/10.1038/nrmicro2644

3. Paola Bonfante and Andrea Genre. 2010. Mechanisms underlying beneficial plant fungus interactions in mycorrhizal symbiosis. Nature Communications 1, 1: 48. https://doi.org/10.1038/ncomms1046

4. GBIF.org. 2022. Occurrence download. https://doi.org/10.15468/DL.8Q9H2N

5. GBIF.org. 2022. What is GBIF? Retrieved from https://www.gbif.org/what-is-gbif

6. Stilianos Louca, Florent Mazel, Michael Doebeli, and Laura Wegener Parfrey. 2019. A census-based estimate of Earth’s bacterial and archaeal diversity. PLOS Biology 17, 2: e3000106. https://doi.org/10.1371/journal.pbio.3000106

7. Danielle P. Mersch, Alessandro Crespi, and Laurent Keller. 2013. Data from: Tracking individuals shows spatial fidelity is a key regulator of ant social organization. https://doi.org/10.5061/DRYAD.8D8H7

8. Jorrit H. Poelen, James D. Simons, and Chris J. Mungall. 2014. Global biotic interactions: An open infrastructure to share and analyze species-interaction datasets. Ecological Informatics 24: 148–159. https://doi.org/10.1016/j.ecoinf.2014.08.005

9. The Royal Society. 2022. Why is biodiversity important? Retrieved from https://royalsociety.org/topics-policy/projects/biodiversity/why-is-biodiversity-important/